67 research outputs found

    La phrase verbale noyau en français

    Get PDF
    La phrase verbale noyau en français, caractérisée comme la chaîne de mots qui comprend clitiques, auxiliaire, noyau verbal, particules de négation, l'adverbe toujours et la forme tous est étudiée dans un cadre -- libellé 5P -- qui essaye d'intégrer observation, test et calcul -- c'est-à-dire les activités essentielles de toute science du réel -- dans l'étude des phénomènes linguistiques. Le cadre 5P est présenté dans ses caractéristiques essentielles. Les Propriétés permettant de spécifier, sous certaines conditions d'observation, les phrases verbales noyau sont définies, de même que le calcul à effectuer pour générer tous les conséquences de ces Propriétés -- c'est-à-dire les suites qui sont des phrases verbales noyau en français. On montre, par ailleurs, les possibilités de calcul à partir de ces suites. Les caractéristiques de modularité et d'incrémentalité du système sont illustrées, et celui-ci est mis en perspective par rapport à d'autres points de vue qui ont cours en linguistique

    Propriétés et analyse d'un langage

    Get PDF
    International audienceNous présentons dans cet article une nouvelle approche, que nous appelons 5P, permettant la description des propriétés d'un langage et son utilisation pour une analyse automatique. Nous montrons comment cette approche permet la prise en compte de la dimension descriptive de la linguistique. Par ailleurs, nous présentons une technique d'analyse, appelée analyse par Filtrage et Fusion, qui tire parti de cette description en propriétés. Nous montrons en quoi ces deux projets (description d'une langue et analyse automatique) convergent et ouvrent de nouvelles perspectives

    French Order Without Order

    Get PDF
    International audienceTo account for the semi-free word order of French, Unification Categorial Grammar is extended in two ways. First, verbal valencies are contained in a set rather than in a list. Second, type-raised NP's are described as two-sided functors. The new framework does not overgenerate, i.e. it accepts all and only the sentences which are grammatical. This follows partly from the elimination of false lexical ambiguities -- i.e. ambiguities introduced in order to account for all the possible positions a word can be in within a sentence -- and partly from a system of features constraining the possible combinations

    Les tables de Méthodes en syntaxe : introduction à un mode d’emploi

    Get PDF
    L’analyse des tables de Méthodes en syntaxe (Gross, 1975) révèle que celles-ci sont formellement ininterprétables. La méthodologie pour aboutir à une version formalisée est présentée avec un fragment qui l’illustre. Cette version permet d’une part d’extraire les informations au moyen d’un procédé mécanique et d’autre part d’en évaluer les limites. La théorie sous-jacente est caractérisée en dégageant quelques questions essentielles qui doivent être réglées par toute base de données lexicales, et en particulier, celles qui concernent le rapport de la syntaxe avec la sémantique.The analysis of the tables of Méthodes en syntaxe (Gross, 1975) reveals that they cannot be formally interpretable. The methodology to obtain a formalised version is presented together with a fragment which illustrates it. This version allows on the one hand the extraction of the information using a mechanical procedure and, on the other hand, the evaluation of this information. The underlying theory is characterised with the specification of some fundamental questions, particularly those relating to the mapping of syntax with semantics, to which answers must be provided by any lexical data base

    Les structures syntaxiques du langage Vercingétorix I. Problèmes liés à leur naturalité.

    Get PDF
    International audienceLe langage documentaire Vercingétorix 1 (V1) est un outil pour la recherche documentaire, destiné à être utilisé par le documentaliste indexeur pour produire des indexations et les questions documen­taires. Pour satisfaire diverses exigences, on a fait, dans la formulation de V1, le choix de la naturalité. Ce texte attire l'attention sur les désavantages de cette naturalité avec deux objectifs de fond : a) apporter des éléments pour un bilan critique de V1 sur le plan technologique et b) dégager les caractéristiques des langues naturelles susceptibles d'expliquer ce bilan. La discussion s'articule autour des notions de paraphrase et ambiguïté, caractéristiques des langues naturelles et sur les compromis à faire dans le langage V1 (ajout ou non de règles d'utilisation susceptibles de complexifier excessivement le système)

    Description phonologique et codification Ă©conomique du langage

    Get PDF
    International audiencePour transmettre et/ou stocker un texte en langue naturelle, chaque symbole de son signifiant est codifié par une suite de symboles binaires. Dans le cadre de la codification économique du langage, on se propose de réduire autant que possible le nombre de symboles binaires utilisés tout en sauvegardant l’univocité de la codification et de la décodification. Ce texte présente le Code de réduction alphabétique C, où les symboles sont organisés en une pluralité de systèmes en fonction de leurs contextes d’apparition. Un tel code témoigne à la fois d’une manière d’explorer les caractéristiques structurelles des langues naturelles productrices de redondance et de la possibilité d’apporter une réponse, à partir des caractères propres aux langues naturelles, au problème de la condensation de l’information

    Cliticos en frances y modelos linguisticos

    Get PDF
    International audienceGSG (Gramática Sintagmática Generalizada), modelo lingüístico cuyas pautas de base fueron propuestas por Gerald Gazdar, es una alternativa rigurosa y elegante a los modelos chomskyanos. En el trabajo se resumen las principales características de GSG y se muestra cómo, en francés, es posible tratar con un modelo de gramática formalmente simple, fenómenos como el de los clíticos y las topicalizaciones que en la tradición chomskyana requieren útiles formales más poderosos y menos conocidos. Finalmente, se pone en relación la cuestión descriptiva con el problema general de la selección de modelos lingüísticos alternativos

    La linguistique entre science et ingénierie

    Get PDF
    International audienceAn analytical grid is proposed in order to epistemologically characterize studies concerning the formalization and/or computational processing of natural languages. The grid concernes the three basic elements of an empirical science: the domains of observations, of hypotheses and of the corroboration test. In the first domain, the basic objects are expressions, i.e. sequences of codes on magnetic support, and the Observer. Hypotheses are analyzed in terms of the possibility of calculating on them, and of linguistically extending or porting them. The corroboration test confronts hypotheses and observations. Reference works of the textalgorithmic and of the symbolic approaches in language studies are analyzed with respect to the proposed grid. Some perspectives are proposed from elements of a partial evaluation of the two approaches.Une grille d'analyse est proposée pour caractériser sur le plan épistémologique des travaux relevant de la formalisation ou du traitement informatique des langues. Elle porte sur les trois éléments-clés d'une science de l'empirie : le domaine des observations, des hypothèses et du test de corroboration. Dans le premier, on se donne comme objet de base des expressions, suites de codes sur support magnétique, et l'Observateur. Les hypothèses sont analysées selon leurs possibilités de calcul, d'extension et de portabilité linguistiques, et selon leurs visées descriptives ou explicatives. Le test de corroboration les confronte avec les observations. Des travaux qui font référence dans l'approche texto-algorithmique et dans l'approche symbolique sont analysés selon cette grille. Des perspectives sont proposées à partir d'éléments d'une évaluation provisoire des deux approches

    An Evaluation of Inter-Annotator Agreement in the Observation of Anaphoric and Referential Relations

    Get PDF
    International audienceWhen proposing a description of the data he observes, the linguist must make sure that his observations may be also regularly made by other persons. In this paper, we introduce a typology of anaphoric and referential relations and an experiment which aims at assessing that this typology is operational. Given three newspaper articles, five students were asked to identify anaphoric and/or referential relations between expressions and referents. This inter-subjectivity test confirms results already obtained: coreference is an operational notion, but the perspicuity of other relations is not obvious

    Conocimiento de la lengua y técnicas estadísticas en el análisis lingüístico

    Get PDF
    International audienceSon comparados los resultados obtenidos sobre un mismo corpus en la tarea del POS tagging por dos sistemas orientados por enfoques diferentes en lingüística computacional, el uno orientado por el Conocimiento de la lengua (sistema CL) y el otro por Técnicas estadísticas (sistema EST). Se trata de no limitarse a consideraciones globales sobre el « costo » de obtención de los dos tipos de resultados, noción mal definida, ni a cotejar resultados globales, sino de poner en relación los resultados obtenidos con las características lingüísticas involucradas. La problemática de la comparación es clarificada, los sistemas CL y EST presentados, la metodología de la comparación definida y los resultados obtenidos presentados. En el caso comparado, el sistema CL ofrece mejores resultados, pero la conclusión más interesante es la posibilidad de establecer correlaciones entre aspectos de la estructura lingüística y resultados obtenidos por técnicas estadísticas
    • …
    corecore